#tasa de error de palabras

Estudio comparativo de modelos Transformer para ASR del Corán

Este estudio comparativo de modelos Transformer preentrenados para ASR coránico logra un WER de 0.08, superando en 5% al baseline Citrinet. Aprende las claves.

2026-06-19 · 3 min

Entrenamiento E2E para sistema TTS basado en tokens discretos y LLM

El nuevo marco E2E unifica tokenizador, LLM y FM, logrando un WER del 0.78% y 1.56% en TTS, superando a los sistemas en cascada.

2026-06-16 · 2 min

Compresión sin datos ni entrenamiento para modelos de voz mediante agrupación de parámetros

Descubre cómo comprimir modelos de voz como HuBERT y Whisper sin necesidad de datos ni entrenamiento, reduciendo el WER hasta un 34% sin pérdida significativa. ¡Optimiza tu IA!

2026-06-11 · 3 min